home *** CD-ROM | disk | FTP | other *** search
/ The PC-SIG Library 10 / The PC-Sig Library - Shareware for the IBM PC and Compatibles (PC-SIG)(Tenth Edition Disks 1-2804)(1991).iso / PC_SIGCD / 07 / 3 / DISK0731.ZIP / FALSEHIT < prev    next >
Text File  |  1986-01-11  |  1KB  |  40 lines

  1.                    FALSE HITS
  2.  
  3.  
  4.      INDEX maps words into numbers by applying a 
  5. mathematical operation to the letters in each 
  6. word.  The resulting number is divided by 4093 
  7. and the remainder is used as a code to signify 
  8. that a file contains a particular word.  
  9. Different words can generate the same code.  
  10. LOCATE applies the same algorithm to keywords 
  11. and retrieves files on the basis of the code.  
  12. Consequently, LOCATE may (and does) return files 
  13. that do not contain the desired keyword.  We 
  14. call these "false hits".
  15.  
  16.      That appears to be a problem, and indeed is 
  17. a matter to be dealt with.
  18.  
  19.      First, the file list returned does contain 
  20. every file in which the keywords appear.  
  21.  
  22.      Second, the number of false hits decreases 
  23. as the number of keywords increases.  The 
  24. probability of a false hit approaches zero 
  25. quickly.
  26.  
  27.      Third, LOCATE is very fast.  It is a simple 
  28. matter to re-search the index with an additional 
  29. keyword.
  30.  
  31.      Fourth, the desired file is often easily 
  32. spotted from the list returned.
  33.  
  34.      Fifth, many programs exist to scan files 
  35. for a particular keyword, for example, the MS-
  36. DOS utility "find".  
  37.  
  38.      We expect to supply a post LOCATE delivery 
  39. program to address the false hit issue in the 
  40. second quarter of 1987.